#预处理之后的原始数据路径
datapath='/mnt/disk1/luyang/paper_new/prunned_data/'
#文档个数
doccount=29353
#alpha=0.2
#beta=0.3
#translation model的截断数，即1个词最多翻译到filter_num个词
filter_num=1000
#词典的路径
lexicon_path='/mnt/disk1/luyang/paper_new/prunned_data/lexicon'
#collection model的路径
collection_path='/mnt/disk1/luyang/paper_new/ML_data/collection'
#生成的每篇文档的最大似然估计的路径
ML_path='/mnt/disk1/luyang/paper_new/ML_data/'
#所有的Query的路径
query_path='/mnt/disk1/luyang/paper_new/ML_data/Querys'
#global translation model文件的路径
TM_path='/mnt/disk1/luyang/paper_new/ML_data/TM'
#每篇文档的Offline translation model文件的路径
Offline_TM_path='/mnt/disk1/luyang/paper_new/ML_data/OfflineTM_500'
#临时路径，测试截断数的Offline Translation model，其中每个文件是一个文档的offline translation model
tmp_path='/mnt/disk1/luyang/paper_new/tmp_500/'
#决定使用的截断数之后，将tmp_path更新为OfflineTMSingle_path，原因是在计算每篇文档的分数时，只载入这篇文档的model，否则内存耗费非常大，尤其在多进程的时候
OfflineTMSingle_path='/mnt/disk1/luyang/paper_new/OfflineTMSingle'
#Aligned Translation Model 中一个passage的词的个数
passage_length=100
#使用Aligned Translation Model检索时，先用Language model检索，然后排在在前reranking_num的文档用ATM重排序
reranking_num=200
#词典中的词的个数
lexicon_size=78404
#Aligned Translation Model文件的位置
EM_TM_path='/mnt/disk1/luyang/paper_new/src/EM_TM_path'
